核心概念总结
1. 数据比较的基本原则
在比较数据集时,需关注位置度量(如均值、中位数)和离散度量(如标准差、四分位距)。
- 度量选择:根据数据特征选择合适的统计量
- 一致性原则:确保比较的统计量类型一致
- 全面分析:同时考虑位置和离散程度
- 避免混合:不可混合使用不同类型的度量
比较方法分类
离散度量
标准差 vs 四分位距
反映数据分散程度
2. 度量选择策略
- 有极端值:优先使用中位数和四分位距
- 无极端值:可使用均值和标准差
- 对称分布:均值和中位数相近,标准差和四分位距可互换
- 偏态分布:根据偏度类型选择合适度量